Technologien zur Wiederverwendung von Texten aus dem Web

نویسنده

  • Martin Potthast
چکیده

Texte aus dem Web können einzeln oder in großen Mengen wiederverwendet werden. Ersteres wird Textwiederverwendung und letzteres Sprachwiederverwendung genannt. Zunächst geben wir einen Überblick darüber, auf welche Weise Text und Sprache wiederverwendet und wie Technologien des Information Retrieval in diesem Zusammenhang angewendet werden können. In der übrigen Arbeit werden dann eine Reihe spezifischer Retrievalaufgaben betrachtet, darunter die automatische Erkennung von Textwiederverwendungen und Plagiaten, der Vergleich von Texten über Sprachen hinweg, sowie die Wiederverwendung des Webs zur Verbesserung von Suchergebnissen und zur Unterstützung des Schreibens von fremdsprachigen Texten.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Web 2.0 Technologien im Geschäftsprozessmanagement

Erfolgreiches Geschäftsprozessmanagement war und ist auf die Zusammenarbeit von Individuen aus unterschiedlichen Organisationen angewiesen. Web 2.0 Technologien haben die Zusammenarbeit von Internetnutzern an Inhalten ermöglicht. In diesem Industriebeitrag wird deshalb anhand eines Praxisbeispiels untersucht, wo Web 2.0 Technologien ein Projekt aus dem Geschäftsprozessmanagement sinnvoll unters...

متن کامل

Requirements Engineering für Berichtsapplikationen im Produktionsprozess des BMW Werk Leipzig mittels Technologien des agilen Informationsmanagement - Anwendung der SoftWiki-Methodologie zur Realisierung von Produktionscockpits

Der Artikel beschreibt die Anwendung der SoftWiki-Methodologie [LR09] am Beispiel einer Umsetzung eines Produktionscockpits im BMW Werk Leipzig. Dabei wird analog der Produktlinienentwicklung [PBL05], mit dem Ziel der Wiederverwendung von Softwareartefakten, vorgegangen. Bei der Anforderungserhebung soll die einheitliche Sichtweise zwischen allen beteiligten Stakeholdern verbessert werden. Hier...

متن کامل

Evaluierung von Möglichkeiten zur Implementierung von Semantischen Analysen für Domänenspezifische Sprachen

Domänen-spezifische Sprachen dienen der Spezifikation von Modellen einer Anwendungsdomäne. Neben der Syntaxprüfung ist es zunehmend erforderlich auch semantische Prüfungen der Modelle durchzuführen. In den klassischen Werkzeugen zur Entwicklung Domänen-spezifischer Sprachen aus dem Gebiet der Modell-basierten Entwicklung wird häufig OCL zur Spezifikation solcher Bedingungen im Meta-Modell einge...

متن کامل

Neue Konzepte für RDF-Managementsysteme

Durch die Erforschung und Standardisierung von Semantic-Web-Technologien wie dem Resource Description Framework und der Web Ontology Language werden auf lange Sicht große Mengen an semantisch annotierten Daten verfügbar sein. Daher werden Werkzeuge benötigt, die ein effizientes Verarbeiten, Transformieren und Anfragen dieser Informationen ermöglichen. Dieser Beitrag beschreibt die Operationen a...

متن کامل

Inhaltsorientierte Navigation in automatisch generierten Hypertext-Basen

Der automatische Aufbau von Hypertexten aus Kollektionen linearer Texte erfordert Verfahren zur Analyse und Segmentierung von Texten, sowie zur Generierung von Hypertext-Kanten. In diesem Beitrag werden Theorien zur Beschreibung der thematischen Struktur von Texten aufgegriffen und zur Entwicklung von Kriterien genutzt, die es erlauben, inhaltlich begründete Kanten zwischen Textfragmenten zu er...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011